Una vez descargados los archivos de datos, vamos a ubicarlos al interior de una carpeta llamada data que a su vez crearemos dentro del directorio de nuestro proyecto.
# Instalación del paquete tidyverse
install.packages("tidyverse")
# Si hay problemas de compatibilidad
# install.packages("tidyverse", dependencies=TRUE, INSTALL_opts = c("--no-multiarch"))
# Instalación del paquete DBI
install.packages("DBI")
# Instalación del paquete RMariaDB
install.packages("RMariaDB")
# Cargamos los paquetes que acabamos de instalar
library("tidyverse")
library("DBI")
library("RMariaDB")Note que tidyverse es una colección de paquetes ampliamente usada en la ciencia de datos en R, por lo que al instalarlo se instalan a su vez numerosos paquetes que son útiles para cargar, manipular, limpiar, procesar, modelar y visualizar datos.
Veámonos cómo cargar datos en distintos formatos.
# Una forma de declararlo usando la función read_delim
data_txt <- read_delim(
file = "data/DataObesidad.txt",
delim = "|",
locale=locale(decimal_mark = ".")
)
# Otra forma de declararlo usando la función read_delim
read_delim(
file = "data/DataObesidad.txt",
delim = "|",
locale=locale(decimal_mark = ".")
) -> data_txt
# Otra función para leer los datos usando la función read.table
read.table(
file = "data/DataObesidad.txt",
sep = "|",
header = TRUE,
dec = ".",
fileEncoding = "UTF-8"
) -> data_txt
str(data_txt)Al importar archivos de texto plano revisar:
Al importar archivos separados por comas revisar:
library("readxl")
read_excel(
path = "data/DataObesidad.xls"
) -> data_xls
str(data_xls)
read_xlsx(
path = "data/DataObesidad.xlsx",
sheet= "Obesidad"
) -> data_xlsx
str(data_xlsx)Al importar datos desde Excel, asegúrese de especificar el nombre exacto de la hoja que contiene sus datos brutos.
Podemos leer desde R hojas de cálculo públicas o privadas.
library("googlesheets4")
# Comando para que no nos exija autenticación
gs4_deauth()
# Declaro el enlace
link = "https://docs.google.com/spreadsheets/d/1iM7i0nd3EPMzH79oZEo48nIcWbyT14ThsJ8ZO9r3F4Y/edit?usp=sharing"
# Lectura de datos
data_gs <- read_sheet(link)
str(data_gs)Ya sabemos importar datos.